Cách chia nhỏ , phân tách file PDF trong C#

Cách chia nhỏ , phân tách file PDF trong C#

Hướng dẫn sử dụng C# để tách tài liệu PDF hiệu quả

Tại sao cần tách tài liệu PDF?

PDF là định dạng tài liệu điện tử phổ biến, nhưng đôi khi bạn cần chia nhỏ tệp PDF lớn thành nhiều tệp riêng biệt để dễ quản lý hơn. Ví dụ: nếu tài liệu chứa nhiều chương, bạn có thể chia từng chương thành một file PDF riêng để dễ dàng tìm kiếm và đọc. Ngoài ra, việc chia nhỏ còn giúp giảm dung lượng tệp, thuận tiện cho việc lưu trữ và chia sẻ.

Trong bài viết này, chúng tôi sẽ hướng dẫn cách sử dụng C# và Spire.PDF miễn phí cho .NET để tách tài liệu PDF nhanh chóng và dễ dàng.
Bài viết bạn có thể quan tâm : Chuyển đổi PDF sang Word bằng Python với pdfminer.six và python-docx


Cách cài đặt Spire.PDF miễn phí cho .NET

  1. Mở dự án trong Visual Studio.
  2. Truy cập Quản lý gói NuGet và tìm kiếm FreeSpire.PDF.
  3. Cài đặt gói Free Spire.PDF cho .NET.
    JetBrains Rider 2024 – Phần Mềm Lập Trình C# và .Net Hiệu Quả MacOs App

Lưu ý: Phiên bản miễn phí hỗ trợ tài liệu tối đa 10 trang. Nếu cần xử lý tài liệu dài hơn, hãy sử dụng phiên bản thương mại.


Hướng dẫn chia PDF thành các tài liệu PDF một trang riêng biệt

Các bước thực hiện

  1. Tạo biến chuỗi inputFile chứa đường dẫn tệp PDF cần xử lý.
  2. Tạo biến chuỗi outDirectory chứa đường dẫn thư mục lưu kết quả.
  3. Tạo đối tượng PdfDocument để xử lý tài liệu PDF.
  4. Tải tệp PDF vào đối tượng tài liệu.
  5. Sử dụng phương thức Split để tách mỗi trang thành một tài liệu PDF riêng biệt.

Ví dụ minh họa

using System;
using Spire.Pdf;

namespace SplitPDFIntoIndividualPages
{
    class Program
    {
        static void Main(string[] args)
        {
            // Đường dẫn tệp PDF đầu vào
            String inputFile = "C:\\Users\\Administrator\\Desktop\\Document.pdf";

            // Đường dẫn thư mục lưu kết quả
            String outputDirectory = "C:\\Users\\Administrator\\Desktop\\Output\\";

            // Tạo đối tượng PdfDocument
            PdfDocument doc = new PdfDocument();

            // Tải tệp PDF
            doc.LoadFromFile(inputFile);

            // Tách mỗi trang thành một file PDF
            doc.Split(outputDirectory + "output-{0}.pdf", 1);
        }
    }
}

Hướng dẫn chia PDF thành các tài liệu PDF với trang đã chọn

Các bước thực hiện

  1. Tạo biến chuỗi inputFile chứa đường dẫn tệp PDF đầu vào.
  2. Tạo biến chuỗi outDirectory để lưu trữ kết quả.
  3. Tạo đối tượng PdfDocument và tải tệp PDF nguồn.
  4. Tạo các đối tượng mới PdfDocument để lưu các trang cụ thể.
  5. Sử dụng phương thức InsertPage hoặc InsertPageRange để chọn trang cần tách.
  6. Lưu tài liệu mới bằng phương thức SaveToFile.

Ví dụ minh họa

using Spire.Pdf;
using System;

namespace SplitPdfByPageRanges
{
    class Program
    {
        static void Main(string[] args)
        {
            // Đường dẫn tệp PDF đầu vào
            String inputFile = "C:\\Users\\Administrator\\Desktop\\Document.pdf";

            // Đường dẫn thư mục lưu kết quả
            String outputDirectory = "C:\\Users\\Administrator\\Desktop\\Output\\";

            // Tải tệp PDF nguồn
            PdfDocument sourceDoc = new PdfDocument(inputFile);

            // Tạo các tài liệu con
            PdfDocument newDoc_1 = new PdfDocument();
            PdfDocument newDoc_2 = new PdfDocument();

            // Chèn các trang đã chọn
            newDoc_1.InsertPage(sourceDoc, 0); // Trang đầu tiên
            newDoc_2.InsertPageRange(sourceDoc, 1, sourceDoc.Pages.Count - 1); // Các trang còn lại

            // Lưu các tệp PDF
            newDoc_1.SaveToFile(outputDirectory + "output-1.pdf");
            newDoc_2.SaveToFile(outputDirectory + "output-2.pdf");
        }
    }
}

Tính năng khác của Free Spire.PDF for .NET

Ngoài việc tách tài liệu PDF, Spire.PDF còn hỗ trợ:

  • Hợp nhất PDF: Gộp nhiều tệp PDF thành một tệp.
  • Tạo PDF: Tạo tài liệu PDF từ đầu bằng C#/VB.NET.
  • Mã hóa PDF: Bảo mật tệp PDF với mật khẩu.
  • Nén PDF: Giảm dung lượng tệp PDF.
     

Ủng hộ chức năng chuyển pdf sang word của blog ! 


Kết luận

Với hướng dẫn trên, bạn có thể dễ dàng chia nhỏ tài liệu PDF bằng C# và Spire.PDF. Hy vọng bài viết này sẽ giúp bạn quản lý tài liệu hiệu quả hơn!